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摘 要 : [目的 /意义 ] 智 慧 数据 是 “智慧 地 球 ” 背 景 下 数据 科学 领域 的 新 概念 ,目前 其 理论 探讨 与 实践 应 用 均 在 迅速 发 展 。 
梳理 学 界 对 其 认 知 脉络 ,凝聚 共识 、 辩 析 差 异 ,对 厘清 智慧 数据 理论 体系 和 促进 智慧 数据 应 用 开发 意义 重大 。[ 方 
法 /过 程 ] 在 广泛 深入 阅读 国内 外 领域 相关 文献 的 基础 上 ,将 智慧 数据 研究 脉络 梳理 为 概念 内 涵 、 价 值 取向 、 关 键 
技术 与 应 用 框架 四 个 分 面 , 通 过 对 比 与 pos 归纳 出 智慧 数据 的 三 种 概念 视角 、 五 个 特性 特征 、 五 类 价值 取向 、 三 
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> 范 精准 及 价值 增值 ,其 价值 取向 呈现 出 多 元 化 复合 特征 ,其 技术 体系 旨 在 提供 “可 计算 -可 理解 - 可 会 话 ” 的 逐 级 

E 演进 支撑 ,其 应 用 框架 核心 在 于 精准 实现 “数据 "与 "用户 "的 智慧 交互 ,未 来 智慧 数据 理论 体系 还 需 在 大 “数据 科 

O 学 ” 观 下 围绕 理论 体系 构建 .数据 权利 治理 .技术 均衡 发 展 、 服 务 层级 深化 、 理 论 实践 交融 等 不 断 完善 。 

e 词 : 智慧 数据 数据 科学 ”价值 关键 技术 应 用 研究 综述 
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c9 
EM 大 数据 ` 云 计算 .人工 智 能 等 技术 的 发 展 与 突破 ,两 种 
Gp 观点 逐渐 交融 ,形成 了 借助 相关 技术 分 析 和 掌握 数据 、 


二 2008 年 IBM 提出 “智慧 地 球 (Smart Planet) ”项 | 提炼 体系 化 知识 .升华 出 智慧 并 协助 决策 的 数据 的 共 
ESRR “互联 网 + 物 联 网 = 智慧 地 球 ” 的 战略 布 | 识 , 并 探索 了 丰富 的 智慧 数据 实践 领域 。 当 然 ,不 容 回 
局 6 葡 现 人 类 生活 方式 的 物 联 化 、 互联 化 与 智能 化 ， 避 的 是 ,学 界 关 于 智慧 数据 研究 尚 处 在 理论 与 实践 交 
"Sia Data” 正 是 从 此 中 产生 的 新 概念 。“ Smart Data" 织 的 多 元 视角 的 探讨 中 ,还 没有 形成 较为 清晰 的 认 知 
ilt; 大 学 术 研究 的 视野 后 ,学 者 们 的 认 知 出 现 分 化 :一 种 | 脉络 和 理论 体系 :其 是 什么 ? 特征 如 何 ? 有 何 价值 ? 
观点 较为 狭义 ,认为 Smart Data 是 智能 工具 和 技术 的 ，| 通过 何 种 技术 可 以 实现 ? 应 用 场景 与 前 景 如 何 ? 
产物 ,意图 通过 先进 的 技术 采集 高 流速 与 体 量 大 的 数 截至 2020 年 12 月 底 , 笔 者 以 "智慧 数据 ”Smart 
字 内 容 , 从 中 挖掘 超越 性 知识 从 而 获得 智慧 ,但 往往 又 data ”为 主题 词 , 在 中 国 知 网 .Springer , Elsevier, Web of 
受 限于 数据 技术 水 平 未 达到 预期 的 智慧 性 " ,表现 出 “| Science 数据 库 中 共 检 索 出 52 篇 中 文 文献 与 153 篇 外 
“Smart ,but not yet smart enough. "的 数据 缺陷 祖 ; 另 一 | 文 文献 ,经 过 深入 阅读 ,筛选 整理 出 90 余 篇 相关 度 较 
种 观点 较为 广义 ,认为 Smart Data 是 数据 形态 和 价值 | 高 文献 。 本 研究 立足 智慧 数据 的 发 展 脉络 , 旨 在 通过 
导向 的 产物 ,强调 竭力 避免 现 有 数据 形态 的 缺陷 ,破除 | 文献 梳理 和 理论 思辩 ,确定 智慧 数据 的 特性 特征 ,概览 
数据 量 级 的 约束 ,力图 结构 规范 .语义 清晰 \ 可 视 化 与 | 智慧 数据 价值 取向 ,归纳 智慧 数据 关键 技术 ,探究 智慧 
可 对 话 的 形态 呈现 数据 价值 。 两 类 观点 侧重 不 同 ,前 | 数据 应 用 框架 ,总结 智 站 数据 发 展 模式 与 应 用 机 理 , 以 
者 倾向 于 过 程 和 技术 ,后 者 关注 于 结果 和 价值 。 随 着 | 期 全 面 综合 地 阐释 智 意 数据 研究 的 最 新 观点 与 动态 。 
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2. 智慧 数据 概念 辨析 
2.1 智慧 数据 的 概念 


智慧 数据 发 展 迄 今 , 还 未 形成 统一 的 概念 及 概念 
体系 。 目 前 学 界 对 智慧 数据 概念 的 界定 可 粗 分 为 三 个 


架 和 模型 的 顶层 精细 化 设计 ;过 程 视角 下 的 智 芒 数据 
侧重 逐步 演进 ,强调 自 下 而 上 的 逐 级 提炼 以 创造 新 价 
值 。 三 者 之 间 各 有 侧重 ,统一 于 数据 的 规范 精准 及 价 
值 增值 , 尤 以 过 程 视 角 下 “数字 化 一 一 数据 化 一 一 智慧 
化 "三 级 演进 的 观点 于 现 阶段 被 普遍 接纳 ,数字 化 形成 


c 


视角 :价值 视角 结构 视角 、 过 程 视 角 。 笔 者 对 不 同 视 
角 下 智慧 数据 定义 做 了 相关 整理 , 见 表 1。 

笔者 认为 ,价值 视角 下 的 智慧 数据 只 是 一 张 蓝图 ， 
强调 了 数据 价值 的 递 阶层 级 ,但 并 未 给 出 具体 的 方案 ; 
结构 视角 下 的 智慧 数据 侧重 一 步 到 位 ,强调 对 数据 框 


可 计算 的 结构 ,便于 利用 与 存储 ;数据 化 突出 可 理解 的 
内 涵 ,以 语义 化 及 可 视 化 为 进 阶 ,于 在 拓展 智慧 应 用 ; 
智慧 化 呈现 可 会 话 的 形态 ,表达 具象 价值 ,关注 动态 智 
的 呈现 形态 。 


dit 


表 1 不 同 视角 下 智慧 数据 的 定义 
定义 视 核心 观点 代表 学 者 及 表述 
价值 视角 ”智慧 数据 是 对 事实 抽 丝 ”从 事实 出 发 ,将 知识 映射 为 Know-what Know-how Know-why ,并 结合 丰富 的 真理 呈现 智慧 的 价值 ,呈现 出 “事实 
剥 草 后 的 高 阶 价值 旦 现 。 与 观念 -知识 -智慧 "结构 [3];@ 数 据 有 从 低 往 高 的 价值 提取 与 表现 形式 ,呈现 出 “数据 - 信息 - 知识 ERR 

n (Wisdom) ”知识 金字 塔 结构 (4;@ 吞 下 数据 是 有 价 信 的 数据 的 子 集 55] 

~ 

Gg 视角 — 智慧 数据 经 由 规范 设计 ”加 智慧 数据 较 于 一 般 数据 更 为 “干净 "6];@ 智 慧 数 据 领域 即 是 建立 在 给 定数 据 集中 构建 能 产生 “智慧 (Smant- 
eo 而 形成 ,形成 智慧 数据 框 。 ness)” 的 数据 模型 71;G@) 智 慧 数 据 形成 阶段 应 该 谋 入 可 解决 4WIH(Who .Where .When Why , How) 疑难 的 智慧 数 
© 架 据 框架 ,从 而 权威 描述 智慧 数据 适用 领域 ,框架 越 精 化 ,描述 适用 领域 内 复杂 对 象 的 不 确定 性 就 越 少 [8] 

e 

CEPAM 。 智慧 数据 经 由 演化 路 径 — 智慧 数据 可 由 大 数据 转换 [9] ;@)“ 智 慧 数据 "用 于 表示 将 原始 数据 转换 为 可 以 处 理 的 数据 ,并 以 获得 有 价值 的 信 
ep 形成 息 为 目标 [0] ;@ 知 慧 数 据 的 建设 需要 经 历 “数字 化 一 一 数据 化 一 智慧 化 "阶段 演进 ,从 可 计算 、 可 理解 走向 可 会 

话 [11];@ 根 据 数据 驱动 的 理念 ,智慧 数据 是 由 多 源 数 据 历经 “数据 化 -语义 化 -可 视 化 -智慧 化 "演化 形成 (12] 

e 

C 
2N 智慧 数据 的 特点 捷 性 的 结合 。 可 操作 性 要 求 数据 应 推进 可 伸缩 的 操 


已 目前 学 界 对 智慧 数据 的 特性 探讨 尚 没有 体系 化 ， 
仅 容 学 者 明确 提出 商业 领域 关 正 数据 必须 具备 的 三 个 
关 尼 特性 :准确 性 .可 操作 性 和 敏捷 性 5 。 在 此 基础 
B incus mu 
PITAA E SEEM EAE: A TE MATE KAI 
FECRHEE .与 决策 性 。 

@O(1) 融 合 性 。 智 慧 数据 融合 性 是 对 数据 来 源 、 数 
据 结构 与 数据 适 配 性 的 融合 。 来 源 上 需 融 合 天 地 数 
据 . 社 交 数据 .物流 数据 .办 公 数 据 、 个 人 终端 数据 五 大 
领域 ;结构 上 将 杂乱 .不 可 见 的 、 未 关联 的 ,使 用 率 
较 低 的 数据 转化 为 规范 组 织 ,管理 .可 发 现 的 .相互 关 
联 的 .可 重用 的 形态 "1; 适 配 性 上 需要 适 配 特定 领域 、 
寺 定 主题 ,特定 行业 的 数据 特性 59 。 

(2) 精 确 性 。 智 慧 数据 精确 性 包含 对 数据 内 容 描 
述 的 精准 性 要 求 和 对 数据 自我 保护 形式 的 确定 性 要 
求 。 智 慧 数 据 的 理想 状态 是 拥有 优质 可 靠 的 ,精确 真 
实 的 数据 "" ,有 足够 的 精度 驱动 价值 ;同时 要 有 足够 
的 隐私 保护 与 数据 权力 划分 ,诸如 从 纯 数码 格式 转化 
为 非 明文 数字 字符 串 的 模拟 格式 59 ,从 而 规避 可 能 所 
法 律 和 技术 问题 ,以 合法 合理 地 访问 和 使 用 数据 。 

(3) 实 用 人 性。 智慧 数据 的 实用 性 是 可 操作 性 与 敏 


作 , 以 实现 跨 平 台 应 用 等 决策 目标 的 最 大 化 ” 。 人 敏捷 
性 要 求 数 据 必须 是 实时 可 用 的 ,可 随时 准备 好 、 灵 活 地 
适应 不 断 变化 的 需求 环境 '"。 符 合 可 操作 性 和 敏捷 
性 的 智慧 数据 较 之 其 他 数据 更 为 实用 ,具有 “ 召 之 即 
来 ,来 之 能 用 ”的 优越 性 。 

(4) 增 值 性 。 智 慧 数 据 的 增值 性 是 对 数据 价值 密 
度 的 提升 ,是 高 效率 和 高 效用 的 要 求 。 高 效率 要 求 数 
据 收集 .存储 和 分 析 等 操作 能 力 增强 ,以 最 大 化 利用 数 
据 "”。 高 效用 要 求 数 据 有 更 优质 的 语义 表达 ,以 更 精 
炼 的 语义 解释 协助 决策 目标 达成 ”。 数 据 增值 本 质 
上 是 面向 语义 化 .情景 化 的 智慧 数据 逐 级 分 析 过 程 ,其 
阶段 性 输出 的 知识 成 果 是 搭建 知识 金字 塔 的 基石 1。 
(5) 决 策 性 。 智 慧 数据 决策 性 是 前 脆性 .系统 性 、 
评估 性 的 协同 。 前 瞻 性 指 超越 数据 表象 与 现 有 知识 水 
平 的 预见 ,理解 并 识别 潜在 影响 的 迹象 ， 。 系 统 性 指 
在 复杂 和 不 确定 环境 下 ,结合 资源 配置 与 系统 信息 采 
取 最 佳 行动 的 决策 ”1 。 评 估 性 包括 对 决策 条 件 分 析 
和 决策 后 价值 判断 , 旨 在 对 动态 变化 .时 效 极 强 的 数据 
作出 准确 评估 。 
2.3 ”相关 概念 厘清 

智慧 数据 与 数据 智慧 :两 者 争议 焦点 是 人 的 智慧 
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? 数据 本 身 无 法 获取 意识 ,让 数据 识 

类 各 是 一 个 战略 性 的 错误 ,真正 的 

ee o 人 
4H: 


级 和 数据 形态 ,天 数据 经 预 处 理 ， m cn d 
理 、 解 释 ,并 以 结构 化 的 方式 访问 它 ” , 即 可 转换 为 智 
慧 大 数据 。 在 未 来 ,大 数据 必然 智慧 化 发 展 , 智 意 数 据 
必然 大 数据 化 发 展 。 
智 芒 数据 与 领域 数据 科学 数据 :智慧 数据 统领 各 
领域 数据 ,搭建 跨 领域 数据 的 数据 桥梁 。 科 学 数据 
是 特定 范畴 的 领域 数据 之 一 ” ,部 分 科研 数据 具备 智 
慧 数 据 的 雏形 ,具备 基本 的 标准 规范 与 质量 挖 人 


3 SS 智慧 数据 价值 取向 


COR AUIBUS ES BUD, 处理 原 始 数据 以 获得 有 
mia cte nomo Ur" 1。 智 慧 数 据 价 
信 声 向 旨 在 辩 识 智慧 数据 基本 价值 立场 及 所 表现 出 来 
的 基本 价值 态度 ,本 研究 将 其 归纳 为 管理 价值 .经 济 价 
IUBE t. Sc ERI I HU 

SE 智慧 数据 的 管理 价值 


c 


o 


价值 和 知识 潜能 ,推动 信息 技术 的 革新 ,增强 人 们 创新 
创造 的 洞察 力 和 决策 力 , 从 “已 知 - 未 知 ” 走 向 “未 知 
-RAP R. Kitchin 认为 高 级 资源 模式 能 满足 科 
技 创新 对 数据 有 效 性 、 完 整 性 .动态 变化 的 极 高 需 

求 “ , 曾 茧 指出 通过 关联 数据 、 bid 知识 发 


现 、 情 景 重 构 等 方式 增强 数据 的 表达 能 ,刘炜 整 
理 数字 人 文 技术 体系 ,指出 智慧 化 服务 将 加 速 潜在 研 
究 项 目的 设计 和 发 现 ” 。 
3.4 智慧 数据 的 文教 价值 

智 臣 数 据 的 文教 价值 是 其 在 智慧 文化 中 人 文 价值 


Pind dla dide oo UU 


景 "的 文化 服务 需求 ”1 。 对 于 教育 教学 , 罗 琳 提出 “ 数 
据 - 人 -知识 ”的 知识 流动 框架 ,其 中 智慧 数据 是 能 够 
成 为 知识 酵母 的 数据 ,经 过 有 效 的 知识 转换 与 利用 , 智 
慧 数 据 可 智能 化 响应 人 的 知识 需求 ,成 为 为 人 所 用 的 
有 价值 的 知识 结合 体 。 
3.5 智慧 数据 的 法 律 价值 

智慧 数据 的 法 律 价值 是 以 人 为 本 ,控制 数据 隐私 
边界 的 安全 保障 。A. Cavoukian 以 用 户 为 中 心 提出 智 
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Meo cu 一 方面 ,M. S. Javan M. K. 
Akbüri 从 数据 资源 配置 出 发 ,认为 智慧 数据 为 数据 采 
镶 我 换 等 操作 提供 数据 融合 抽象 框架 ”” ， 使 得 多 个 
有 保值 的 数据 被 跨 平 台 观 测 与 操作 ,从 而 提供 更 全 
面 的 决策 愿景 ; 另 一 方面 ,J，Chen 等 学 者 从 数据 资源 
训 河 出 发 ,认为 智慧 数据 整合 了 针对 性 评估 、 可 靠 性 分 
析 、 自 动 构建 最 优 策略 等 实时 交互 功能 ” ,提供 完全 
感知 世界 .动态 了 解 事件 、 人 机 充分 互动 的 智慧 服务 决 
SENSU, 
3.2. ”智慧 数据 的 经 济 价值 

智慧 数据 经 济 价值 是 指 挖掘 源 没 在 海量 数据 中 的 
经 济 价值 2 ,识别 并 消除 数据 处 理 过 程 中 非 增值 环 
节 , 从 而 创造 利润 。 在 产品 生产 环节 ,S， Belkadi 指出 
智慧 数据 唤 新 了 精益 生产 理念 2 ,以 精细 化 的 重要 信 
息 优化 生产 决策 ,最 终 指向 本 轻 利 厚 的 创收 ;在 售后 服 
务 环节 ,英国 政府 调研 智慧 数据 对 消费 市 场 的 助力 ,发 
现 借助 智慧 数据 技术 可 实现 消费 者 利益 相关 指标 的 远 
程 采集 .分析 及 反馈 , 找 准 基于 客户 需求 的 商业 竞争 优 
势 ,从 而 促进 产品 市 场 良性 发 展 051 。 
3.3 ”智慧 数据 的 创新 价值 

智慧 数据 创新 价值 体现 在 其 可 最 大 天 


旦 度 激活 数据 


原则 、 透 明 原则 安全 保障 性 原则 、 问 责 原则 规范 数据 
访问 与 使 用 操作 ”。 同 时 , D. Roman 指出 智慧 数据 
将 区 块 链 、 人 工 智能 等 技术 应 iind rd ME x 
动 将 隐私 和 安全 纳入 数据 自我 保障 范围 ” , 既 实 现 数 
据 透 明 使 用 又 保障 数据 可 追溯 ,是 合法 合理 使 用 智慧 
数据 的 关键 。 


4 智慧 数据 关键 技术 
4.1 从 智慧 数据 会 议 研究 议题 勘测 智慧 数据 关键 
技术 


智慧 数据 包含 哪些 关键 技术 ? 迄今 ,理论 界 和 业 
界 均 没 有 给 出 权威 的 阐释 。 笔 者 认为 , 智 茵 数据 技术 
是 数字 化 .数据 化 、 智 意 化 等 几 簇 关 键 技 术 的 集合 ,其 
本 质 是 不 断 发 展 中 的 技术 体系 。 本 研究 也 尝试 依据 
IEEE 组 织 从 2015 年 至 2020 年 先后 举办 的 6 Jii Smart 
Data Conference 的 会 议 议题 梳理 智慧 数据 关键 核心 技 
AR ,通过 对 智 意 数据 演进 路 径 中 数字 化 (可 计算 ) C 


据 化 (可 理解 ) 智慧 化 (可 对 话 ) 三 个 环节 的 技术 对 
比 , 探 寻 不 同 阶 段 智 慧 数据 关键 支撑 技术 的 异同 ,如 表 
2 所 示 : 


图 天 情报 三 作 
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R2 演进 路 径 下 智慧 数据 关键 技术 及 各 阶段 数据 形式 
演进 阶段 关键 技术 簇 具体 技术 类 别 代表 性 技术 方案 与 工具 
数字 化 (可 计算 ) 数据 管理 技术 数据 采集 与 传输 物 联网 及 RFID ;拍摄 .采样 .捕捉 等; 扫描; 网络 怜 虫 
数据 转换 与 集成 ETL 集成 工具 (Kettle Talend .Apatar 等 ) ;NoETL 工具 ( Athena 等 ) 
数据 存储 分 布 式 文件 /数据 库 系 统 ;NewSQLANoSQL( 如 neo4j JSON-LD 等 ) 
数据 查询 和 索引 SQL 查询 .SPARQL 查询 
数据 安全 技术 隐私 认证 身份 验证 .虹膜 识别 .认证 协议 ; 
去 中 心 化 技术 区 块 链 技术 智能 合同 
数据 基础 设施 源 智慧 大 数据 系统 Hadoop „Spark „Flink 和 Storm 等 
智慧 数据 计算 模式 边缘 计算 、 云 计算 、 并 行 计算 、 流 计算 等 
数据 化 (可 理解 ) 知识 发 现 技术 数据 挖掘 /机 器 学 习 / 深 度 学 习 自动 分 类 聚 类 ,背景 /情感 分 析 CAS AIT V ERRAT VEHI UA 
语义 化 技术 语义 网 与 语义 本 体 Protégé 等 建 模 技 术 ,本体 映射 及 合并 等 
关联 数据 URI XML 、OWL RDF(s) 
知识 图 谱 知识 抽取 知识 融合 .知识 推理 等 
可 视 化 技术 数据 画像 技术 户 画 像 、 机 构 画 像 等 
可 视 化 分 析 可 视 化 文本 、 图 谱 可 视 化 .GPS/GIS 可 视 化 、 统 计 图 表 三维 建 模 、 时 空 态势 
展示 、VR/AR 
A 可 会 话 ) 认 知 技术 认 知 计算 与 计算 神经 科学 认 知 系统 、 人 脑 神经 元 、 脑 成 像 研究 . 脑 启发 计算 .意图 识别 
co 人 工 智 能 遗传 算法 、 人 工 神经 网 络 .专家 系统 
eo 智能 决策 自动 化 决策 大 数据 预测 
O 会 话 技术 自然 语言 处 理 文本 生成 ;句法 分 析 、 语 义 分析 \ 语 音 识别 
【ew | 智能 问答 技术 智能 问答 系统 .搜索 结果 智能 交互 .推荐 系统 


AQ 智慧 数据 演进 路 径 中 的 关键 技术 簇 解析 
〇 (1) 数 字 化 关键 技术 秘 解 析 。 数 字 化 旨 在 实现 数 
本 加 可 计算 格式 的 转化 ,完成 现实 世界 向 数字 世界 的 
映 躬 ,构成 智慧 数据 的 数据 基础 。 数 字 化 的 难点 是 在 
类 3 纲 安 全 的 前 提 下 ,集成 分 散 数据 与 融合 多 源 异 构 数 
JESS ,完成 数据 的 集成 管理 ,夯实 智慧 数据 基础 设施 
建 谋 。 该 阶段 的 关键 技术 包括 :数据 管理 技术 :数据 
采 案 与 传输 ,涉及 利用 物 联 网 ,采样 等 技术 直接 采集 传 
输 三 手数 据 , 或 采用 扫描 、 网 络 息 虫 技术 让 取 网 络 平台 
的 玉手 资料 ;数据 转换 与 集成, 包括 重视 转换 流程 的 规 
范 性 的 Kettle „Talend , Apatar 等 技术 工具 ,或 重视 转换 
操作 的 可 访问 性 的 Athena 等 技术 工具 ;数据 存储 , 
兴 的 代表 性 技术 如 Neo4j 等 NoSQL/NewSQL 数据 库 ， 
可 将 数据 直接 存储 在 图 结构 中 ,以 自由 扩展 性 能 优异 
的 架构 优化 存储 资源 ; 数据 查询 与 索引 技术 ,通过 
SPARQL 语句 对 结构 化 的 RDF 数据 做 快速 机 器 查询 ， 
系统 性 索引 知识 和 技术 。@ 数 据 安全 技术 :利用 区 块 
链 等 去 中 心 化 技术 增强 可 信 的 分 布 式 计算 能 力 、 建 立 
安全 可 信 的 数据 存储 系统 ,维护 数据 的 完整 性 .可 用 
性 ;利用 身份 验证 技术 ,通过 虹膜 验证 ,生物 验证 等 手 
段 完成 身份 管理 .控制 访问 ,维护 数据 的 机 密 性 。@ 数 
据 基础 设施 :一 类 是 为 智慧 数据 流程 运行 提供 平台 基 
础 的 Hadoop „Spark 等 开源 的 智慧 大 数据 系统 ;一 类 是 
为 提升 智慧 数据 计算 效能 的 边缘 计算 、 云 计算 、 并 行 计 
算 , 流 计算 等 新 计算 模式 。 


数字 化 关键 技术 最 新 进展 主要 聚焦 在 数据 管理 技 
术 方 面 :数据 管理 的 开发 方案 从 围绕 “数据 存储 ”转变 
为 围绕 “数据 安全 ”, NoSQL, NewSQL 数据 管理 系统 虽 
已 经 取代 关系 型 数据 库 成 为 对 非 结构 化 数据 高 效 n] 
扩展 分 析 的 流行 管理 系统 ,但 其 演化 原因 是 物理 数据 
存储 结构 从 键 值 对 向 图 的 转换 ” ,而 在 安全 性 的 考量 
上 不 足 ,学 界 正 对 分 布 式 存储 与 分 布 式 处 理 技术 的 安 
全 威胁 作 深 入 研究 “|。 

(2) 数 据 化 关键 技术 簇 解析 。 数 据 化 则 在 实现 数 
据 向 语义 化 格式 转化 ,提升 数字 内 容 的 可 理解 程度 并 
揭示 其 丰富 的 内 涵 。 数 据 化 的 难点 是 避免 因数 据 异 
构 .语义 缺失 .知识 隐藏 等 带 来 的 数据 分 析 、 理 解 及 可 
视 化 的 困难 ,该 阶段 的 关键 技术 包括 :中 知识 发 现 技 
术 : 通 过 数据 挖 气 、 机 器 学 习 、 深 度 学 习 等 方式 展开 自 
动 分 析 , 快 速 洞察 多 粒度 数据 的 隐藏 关系 。@@ 语 义 化 
技术 :语义 网 "及 本 体 是 当前 语义 化 技术 的 核心 , 目 
前 呈现 专 深化 发 展 态势 ,其 催生 了 关联 数据 .知识 图 谱 
等 新 兴 语 义 技术 ,实现 了 知识 表示 从 面向 “string” 到 首 
向 “thing "的 转变 , 葛 定 了 智慧 数据 “可 理解 "的 基础 。 
加 可 视 化 技术 : 既 涉及 专门 型 的 数字 画像 技术 ,可 通过 
整合 静态 与 动态 特征 数据 实现 用 户 或 机 构 特 征 可 视 
化 ;又 涉及 通用 型 的 可 视 化 手段 ,利用 VR/AR 技术 实 
现 多 维度 感知 和 虚拟 交互 ,或 利用 GPS/GIS 可 视 化 
技术 实现 数据 三 维 可 视 化 。 

数据 化 关键 技术 最 新 进展 主要 集中 在 人 机 互动 的 
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可 视 化 技术 领域 :语义 化 技术 标注 语 料 从 特定 领域 扩 
展 到 社会 网 络 科学 领域 ,标注 对 象 主要 面向 图 像 ,以 图 
形 理解 .图 像 标 注 .图 像 检索 等 为 热点 研究 “”!。 可 
视 化 技术 面向 增强 语义 推理 与 降低 视觉 混淆 交叉 研 
究 , 从 图 形 学 基础 走向 交互 视觉 设计 ,从 数据 展示 转换 
为 数据 探索 ”1。 

(3) 智 慧 化 关键 技术 簇 解析。 智慧 化 旨 在 形成 可 
会 话 的 人 机 交互 模式 ,其 难点 在 于 训练 机 器 模拟 人 的 
思维 与 认 知 ,完成 友好 的 人 机 交互 模式 下 的 智慧 决策 ， 
拓展 智慧 应 用 的 适用 场景 。 该 阶段 的 关键 技术 包括 : 
Q@ 认 知 技术 :传统 技术 包括 利用 遗传 算法 、 人 工 神经 网 
络 专家 系统 等 算法 或 工具 表示 复杂 的 数据 分 布 .内涵 
与 特征 ,达到 人 工 智能 与 智能 决策 的 期 望 ;新 兴 技 术 主 
要 指认 知 计算 与 计算 神经 科学 ,通过 认 知 系统 、 人 
脑 神经 元 等 研究 ,解释 人 类 认 知 行为 与 思维 ,为 优化 人 
相交 所 提供 “接口 ” ,升级 计算 机 获取 “智慧 "的 能 力 。 
2 


自然 语言 意图 ,并 用 句法 分 析 .语义 分 析 正 确 理 解 
知 9 申 真 实 含义 ,以 高 质量 的 自然 语言 处 理 迈 向 认 知 知 
8g. 另 一 方面 利用 智能 问答 技术 ,通过 智能 交互 、 


RE 


推荐 系统 识别 人 类 的 社交 需求 和 情感 暗示 ,完成 深 
推理 ,多 轮 交互 问答 等 复杂 自动 问答 ”|。 

智慧 化 关键 技术 最 新 进展 集中 在 会 话 技术 方面 : 
人 机 交互 领域 以 人 机 对 话 技术 为 核心 ,在 海量 数据 积 
累 与 深度 学 习 技 术 的 支持 下 ,人 机 对 话 从 基于 符号 规 
则 和 模板 的 对 话 系 统 、 基 于 统计 机 器 学 习 的 对 话 系统 
迈 向 基于 数据 驱动 的 深度 学 习 对 话 系 统 ”。 将 其 按 
照 对 话 任务 分 类 ,面向 特定 领域 或 任务 的 对 话 系统 向 
引入 大 规模 常识 方向 发 展 ,面向 开放 领域 的 非 任 务 型 
对 话 系 统 向 个 性 化 对 话 方向 发 展 “ 。 


5 智慧 数据 应 用 框架 


5.1 智慧 数据 应 用 机 理 

智 正 数据 应 用 是 以 智慧 数据 智慧 技术 .智慧 产 
品 ` 智 慧 功能 为 对 象 边 界 的 体系 化 服务 ,目前 已 拓展 到 
智慧 商务 .智慧 居 行 .智慧 医疗 智 正 文教 .智慧 科 创 等 
多 个 维度 ,各 领域 的 典型 应 用 在 “依托 何 种 数据 资源 、 
采用 何 种 关键 技术 ,形成 何 种 数据 形态 .适用 何 种 应 用 
场景 "四 个 关键 问题 上 ,呈现 出 较为 明显 的 领域 差异 ， 
如 图 1 所 示 : 


数据 资源 关键 技术 MEHR 功能 /应 用 场景 
N -= E) 
O z E = ~ EM, 智慧 合同 数字 市 场 信息 共享 
《 N Fi 2] dx 
> 人 GPSGIS SHE vh 投资 预测 模型 供应 链 协 同一 体 化 
s 务 Æ KERTA 
es 实 i 
Se MG € 实时 反馈 系统 智慧 决策 
© TCU : 
2 i mE ME ve， e 
n S owsumes [C mwmER o 
—7 E) 社会 数据 画像 
T 居 pasay LER ] SS 智慧 能 源 
ER re L 人工 智能 技术 | <>l 智 丫 技 术 中 心 
人 类 社会 数据 maar 
D O ea 
EXTEGRER 准 医疗 方案 
智 。 医疗 设备 数据 ERARE BB ees "e 
Li AR ee z " 
z xem [ cux 0 EM erae Ez 
疗 i B 
LA — AIWESRA | O, 医院 信息 化 平台 
医疗 文献 数据 医疗 人 机 交互 
MN -2 ENER (Ed soea mn. 
X oj ROSA TE) usu ; 
文 “机构 馆 藏 数据 VR/AR 技术 pm 智慧 文化 
* E 画像 技术 (2) rae Tem 
册 构 用 户 数据 智慧 教育 
Eh C) [号 |] e 
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图 1 智慧 数据 应 用 框架 
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3 面向 智慧 数据 驱动 的 商务 模式 ,包含 
智慧 金 融 ,智慧 物流 智慧 商业 等 经 济 应 用 场景 。 知 下 
商务 主要 涉及 信息 流 数 据 .资金 流 数据 与 物流 数据 ,这 
此 数据 资源 既 散 布 在 网 络 上 ,又 集中 在 数据 中 心 和 去 
端 "9 。 其 应 用 场景 有 :中 应 用 区 块 链 技 术 及 其 他 安全 
认证 技术 ,推广 数字 签名 与 智慧 合同 ,增强 移动 支付 的 
安全 性 、 健 壮 性 与 私密 性 5 ,简化 金融 资产 交易 流程 。 
@ 应 用 机 器 学 习 技术 分 析 金 融 信息 ,有 效 检测 欺诈 行 
为 特征 ,预测 金融 .商业 数据 走势 ,支撑 投资 决策 品 ] 。 
@ 应 用 GPS /GIS 可 视 化 技术 ,搭建 智慧 物流 供应 链 构 
架 ,快速 识别 .定位 分 拣 ,配送 物流 物料 ,使 供应 链 过 
程 可 感 .可 视 . 可 控 "*。@ 应 用 大 数据 预测 技术 ,分 析 
商务 数据 市 场 潜在 的 服务 项 目 、 隐 含 的 营销 思维 ,增加 
FEE lb Rl sH, 
5&9 智慧 居 行 
智慧 居 行 主要 关注 智慧 城市 奸 建设 中 与 衣食 住 行 相 
XEEN tiv 1 Ic 多 交通 ,各 站 jen 
UR GT REZO Y RCRUM A 
n= E N e 
SRA OMHE 器 技术 ,将 各 类 基础 设施 融合 成 一 
人 给 网 络 ” ,促进 社区 治理 中 政府 企业、 社会 组 
CERA 众 等 主体 的 互联 互通 '"。 回 应 用 物 联网 技术 ， 
用 会 元 空间 数据 构建 智慧 决策 系统 '21 , 并 反 向 监测 与 
Bb SUR TRUN. O 应 用 画像 技术 ,标签 化 抽取 社 
区 竹 征 并 勾画 社区 数据 画像 'e1 ,提供 用 户 需求 .环境 
[m E 源 规划 多 种 数据 面板 。@ 应 用 人 工 智能 技术 ， 
NERA AE MMRR ER 及 智慧 技术 中 
,对 智慧 居 行 汇 人 的 各 种 信息 流 做 安全 、 隐 私 与 
5.4 智慧 医疗 
智慧 医疗 以 病人 为 中 心 ,提供 个 性 化 专门 医疗 管 
理 。 智 慧 医疗 要 整理 医疗 设备 .治疗 方案 以 及 医疗 文 
献 等 庞杂 的 数据 。 其 应 用 场景 有 :应 用 物 联网 技术 ， 
构成 医疗 物 联网 ,整合 各 医院 医疗 设备 与 医疗 团队 
的 数据 , 共 建 医疗 资源 共享 。@) 应 用 医疗 数据 挖掘 技 
R ,通过 深度 学 习 医 疗 文献 数据 与 临床 有 效 诊疗 数据 
的 隐藏 关系 ,有 效 第 查 精 准 医疗 方案 。@ 应 用 云 计算 
技术 ,研发 医疗 云 应 用 ,以 云端 存储 的 电子 健康 档案 为 
核心 ,建立 医院 信息 化 平台 ;同时 ,突破 医院 与 患者 的 
时 空 限制 实现 云端 治疗 ,节约 就 医 诊疗 双方 的 时 间 和 
经 济 开销 ;@ 应 用 人 工 智能 技术 ,将 人 机 交互 的 服务 模 
式 穿插 进 各 种 智慧 医疗 情境 中 ,进一步 完善 电子 健康 


档案 ,拓展 医疗 知识 问答 社区 外 延 。 
5.5 智慧 文教 

智慧 文教 虽 在 拓宽 文化 /教育 机 构 馆 藏 的 语义 表 
X ,增强 文化 /教育 空间 的 全 方位 体验 ,为 用 户 感知 ,学 
习 文 化 /教育 知识 创设 良好 环境 '”) 。 智 慧 文教 需 整 合 
文化 遗产 与 图 档 博 等 机 构 的 馆藏 数据 、 服 务 数据 。 其 
应 用 场景 有 :应 用 物 联网 技术 ,实现 智慧 图 档 博 等 机 
构 数 字 馆 藏 的 提供 ,缩短 数字 空间 中 馆藏 和 用 户 之 间 
的 信息 距离 '”;@ 应 用 语义 技术 ,结合 馆藏 特征 、 现 有 
馆藏 资源 与 用 户 需 求 , 关 联 馆藏 对 象 相关 的 解释 性 描 
述 与 多 媒体 内 容 外 延 ,拓展 馆藏 能 表达 的 数据 内 
i ^ 。@ 应 用 VR/AR 技术 ,融合 虚拟 与 现实 空间 边 
界 ,提供 文化 遗产 异 质 时 空 “ 对 话 ” 的 互动 体验 ,发 展 
虚拟 文化 ”。@ 应 用 画像 技术 ,根据 特定 文化 服务 做 
主题 融合 ,精准 刻画 具有 时 空 属性 的 用 户 动态 画 
f 7 ,不 仅 如 此 ,在 教育 背景 下 ,该 技术 可 辅助 测评 师 
EEZ) 分析 课 程 有 效 性 .评定 教学 质量 等 ,配置 符合 
校园 师 生 期 待 的 教育 资源 ,建设 智慧 教育 环境 ”|。 
5.6 智慧 科 创 

智慧 科 创 是 知识 跨 组 织 、 跨 领域 流动 的 交叉 学 习 
过 程 ,通过 协同 创新 提升 智慧 数据 创新 价值 。 智 慧 科 
创 需 其 广泛 集成 文献 数据 .科研 成 果 数 据 机构 服 务 数 
据 等 内 容 资 源 。 其 应 用 场景 有 :利用 知识 图 谱 技 术 ， 
以 图 谱 形 式 直 观 展 示 科 学 知识 之 间 的 关联 与 结构 ,发 
现 其 中 的 规律 并 揭示 其 发 展演 进 的 概貌 '”"”。@@ 利 用 
自然 语言 处 理 技术 ,通过 机 器 翻译 创造 快速 阅读 的 条 
件 ,通过 文本 生成 自动 撰写 高 质量 数据 报告 ,减负 人 工 
工作 站 。@@ 应 用 知识 发 现 技术 ,挖掘 、 聚 类 ,分 析 用 户 
行为 .社会 关系 等 数据 内 容 , 探 寻 深层 次 信息 的 启示 ， 
改善 知识 管理 ” 。@ 应 用 智能 问答 技术 ,升级 可 用 于 
情报 分 析 的 数据 库 、 知 识 平台 等 知识 产品 ,基于 用 户 提 
问 做 信息 检索 与 深度 问答 ,满足 用 户 个 性 化 的 检索 与 
DER 


6 结论 与 讨论 


本 研究 对 国内 外 智慧 数据 领域 目前 取得 的 相关 研 
究 成 果 进 行 了 系统 化 梳理 从 概念 辨析 、 价 值 取向 、 关 键 
技术 .应 用 框架 四 个 基础 维度 ,并 深层 次 探讨 发 展 模 
式 ,应 用 机 理 , 共 归纳 如 下 六 点 关键 结论 : 

(1) 智 翡 数 据 的 思想 可 渊源 至 数据 递 阶 模型 , 概 
念 内 涵 的 核心 在 于 通过 数据 演进 或 结构 设计 实现 数据 
规范 精准 及 价值 增值 。 智 站 数据 具有 融合 性 、 精 确 性 、 
实用 性 ,增值 性 与 决策 性 ,其 "智慧 "是 人 机 互动 的 结 
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果 。 (1) 大 “数据 科学 " 观 下 的 智慧 数据 理论 体系 研 


(2) 智 慧 数 据 以 价值 为 核心 ,其 价值 立场 和 价值 
取向 呈现 出 多 元 化 复合 特征 ,着 重 体现 在 管理 价值 .经 
济 价值 .创新 价值 文教 价值 和 法 律 价值 等 五 个 向 度 。 
智慧 数据 的 价值 取向 是 智慧 数据 应 用 的 价值 和 效用 前 
提 。 

(3) 智 慧 数 据 关键 技术 体系 是 数字 化 .数据 化 、 知 
慧 化 等 几 复 关 键 技术 的 集合 ,本 质 是 为 智慧 数据 “可 计 
算 -可 理解 -可 会 话 ”演进 路 径 提供 技术 支撑 ,其 中 的 
技术 类 别 及 代表 性 技术 方案 都 并 非 是 固化 的 ,而 是 不 
断 动态 更 新 的 。 

(4) 目前 智慧 数据 典型 应 用 包含 但 不 限于 智慧 医 
疗 .智慧 居 行 .智慧 商务 .智慧 文教 .智慧 科 创 等 领域 ， 
均 属 于 智慧 城市 范畴 下 的 细 分 领域 。 智 慧 数据 的 应 用 
加 旨 在 解决 如 何 精准 实现 “数据 " 与“ 用户” 的 智慧 
交配 问题 ,涉及 的 核心 在 于 :哪些 采集 数据 源 ? 数据 如 


IO 


ep 18 SU te O W AK RIR R IUE Ae Rl 
CADIER T RA EMAA EE CR A 
RERE d HORA E, 从 侧重 “未 级 演进 "逐步 发 展 
HTE“ 项 层 设 计 ” ;在 数据 处 理 上 ,从 注重 后 台 “ 数 据 
希 脐 "逐步 发 展 为 前 端 注重 "会 话 交互 "; 在 技术 支 拓 
上 上坟 数据 科学 “通用 技术 ”逐步 锤 化 出 智慧 数据 * 专 
AER” ;在 应 用 领域 上 , 从“ 经典 领域 " 正 拓展 为 “全 
部 短 业 ” ;在 应 用 能 级 上 , 从 “智慧 运营 "逐步 迈进 为 
Uere. 

CD(6) 智 慧 数据 的 应 用 机 理 如 图 2 所 示 ,@D 问 题 / 用 
户 是 价值 创造 的 始 发 点 ,他 们 提出 了 包含 服务 需求 产 
品 需求 等 不 一 而 足 的 重要 需求 ;@ 场 景 /功能 是 价值 增 
值 的 中 转 站 ,其 具象 出 智慧 产品 的 锥 形 与 核心 功能 ,并 
确定 功能 实现 所 需 数据 的 演化 形态 与 模式 ;@ 资 源 是 
价值 加 工 的 目标 对 象 ,加 工 过 程 为 通过 智慧 数据 技术 
演化 出 优质 .规范 的 智慧 数据 ,用 于 匹配 场景 /功能 
运作 需求 ,进一步 满足 初始 问题 /用 户 需求 。 
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满足 满足 


图 2 智慧 数据 应 用 机 理 
诚然 ,在 梳理 前 人 研究 过 程 中 ,笔者 也 发 现 了 当前 
研究 尚 存 的 局 限 性 或 不 足 ,值得 后 续 研 究 中 继续 深入 
探讨 : 


究 。 智 慧 数 据 是 数据 科学 领域 的 新 生 概念 ,其 理论 体 
系 正在 不 断 形 成 ,建构 尚 不 完善 , 且 与 大 数据 、 科 学 数 
据 、 领 域 数据 、 开 放 数 据 等 数据 科学 其 他 领域 喷 有 交 
集 , 更 有 区 分 。 未 来 的 研究 一 方面 应 突出 智慧 数据 作 
为 一 种 对 数据 全 新 认 知 的 方式 ,其 理论 体系 上 的 独 有 
性 , 男 一 方面 也 应 强调 智慧 数据 与 大 数据 等 领域 的 高 
度 关联 性 ,探索 智慧 数据 为 核心 的 数据 科学 交叉 融合 
研究 。 

(2) 从 “价值 ”探讨 进一步 深化 拓展 到 “权利 ” 探 
讨 。 当 前 研究 视角 多 聚焦 在 价值 探讨 上 ,多 在 思考 智 
营 数 据 有 何 用 ,而 对 智慧 数据 使 用 的 合法 性 未 给 予 充 
分 重视 。 后 续 研 究 应 进一步 拓展 智慧 数据 权利 探讨 ， 
开展 智 甘 数据 权利 治理 相关 研究 ,思辨 智慧 数据 的 权 
利 的 生成 逻辑 和 构成 主张 ,探寻 各 领域 内 数据 安全 、 数 
据 脱 敏 等 权利 保障 的 技术 及 制度 手段 。 

(3) 智 慧 数据 技术 体系 应 均衡 “逐步 演进 "类 与 
“规范 设计 "类 。 尽 管 目前 学 界 形成 了 智慧 数据 “由 演 
进而 来 "和 "由 设计 而 来 " 两 种 认 知 ,但 聚焦 到 技术 体 
系 上 ,前 一 观点 更 被 广泛 接纳 ,这 也 是 目前 智慧 数据 技 
术 体 系 呈 现 出 “数字 化 数据 化 .智慧 化 "技术 工具 居 
多 的 根源 所 在 。 未 来 的 智慧 数据 技术 体系 ,需要 不 断 
吸纳 数据 规范 设计 视角 下 的 智慧 数据 新 技术 与 新 工 
具 , 使 得 智慧 数据 的 产生 能 够 一步 到 位 ”, 最 终 形成 
“逐步 演进 "与 “规范 设计 "均衡 发 展 的 综合 技术 体系 。 

(4) 智慧 数据 应 用 领域 还 应 进一步 提升 。 智 正夫 
据 是 应 用 型 的 数据 科学 ,目前 其 应 用 领域 不 断 深 化 ,已 
涉及 商务 交通、 医疗 、 文 化、 科 创 等 多 个 领域 ,但 现 阶 
段 其 应 用 层级 以 面向 智慧 运营 居多 。 未 来 智慧 数据 应 
用 ,应 提供 精准 匹配 、 智 慧 交 互 、 互 利 共 赢 的 用 户 体验 
和 服务 效能 ,实现 从 面向 智慧 运营 到 面向 智慧 决策 的 
能 级 提升 ,形成 全 方位 .路 平台 的 高 质量 智慧 应 用 。 
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Abstract: [ Purpose/significance | The Smart Data is a new concept in the field of data science under the de- 


FElopment of "Smart Earth" , which theoretical exploration and practical application are developing rapidly. Combing 


fhe cognitive veins of the academic circles, gathering consensus and analyzing differences is of great significance to 


Clarify the theoretical system of smart data and promote the application and development of smart data. | Method/ 


acess] Based on extensive and in-depth reading of relevant literature in domestic and foreign fields , this study di- 


vided Smart Data into four aspects; conceptual connotation, value orientation, key technologies and application 


framework. Overall, this study summarized three conceptual perspectives , five connotation features , five types of val- 


ue orientation, three clusters of key technologies and five application areas of smart data through comparison and a- 


nalysis. | Result/conclusion | The study found that the essence of smart data lies in its canonical structure and val- 


ue-added process. Smart data comes from data evolution or structural design, and this enriches its value orientation , 


making itself presents diversified composite value characteristics. Its technical system support the step-by-step “ com- 


putable-understandable-conversational ”data evolution , the core of its application framework lies in the precise reali- 


zation of “data” and “user” intelligent interaction. In the future, the theoretical system of smart data still needs to 


be improved under the view of big “data science” , centering on theoretical system construction, data rights govern- 


ance, balanced development of technology , upgrading service levels, integrating theory and practice , etc. 
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